伺服器世界 - PCDIY! online

伺服器世界

老黃x蘇媽合力打造世界最強DGX A100超級電腦，牙膏廠掰掰! ft. GTC 2020重點介紹

NVIDIA正式於台北時間5月15日舉辦的GTC 2020 (GPU技術大會2020)，CEO黃仁勳在自宅的廚房進行線上演說，主要也順便呼籲當今疫情嚴峻，待在家裡最好！也順便向抗疫英雄們致上最高敬意！在這場GPU技術盛宴中，老黃端出自家最新，並展示其元件構成，包含世界最強大基於台積電7nm製程、Ampere架構的A100 GPU，並提及其伺服器運用到AMD的Rome CPU (即第二代EPYC伺服器處理器)，兩強聯手打造出真正「地表最強」的資料中心級伺服器，就連蘇媽也在Twitter恭賀NVIDIA發表的最新產品，有用到她們家的CPU！牙膏廠可說是在HPC市場中，真正被放鳥！ NVIDIA的GPU技術大會，主要區分為5大部份，包含從數據中心級的運算，到可協作的RTX伺服器遠距利用，當然還有今天的主角：A100 GPU與DGX A100伺服器，以及運用該伺服器所做到的三層AI運用，最後則是EGX智慧物連網的邊緣AI運算以及ISSAC智慧機器人等應用。在這次的主力產品中，主要有上述採用TSMC 7nm製程生產的A100 GPU，為最新Ampere GPU架構，但是並沒有公佈消費級的RTX 3000系列，因此這場GTC 2020大會中，幾乎都是B2B的產品為主，市場也以專業繪圖、醫學、生技、工程、科學、數學、AI(人工智慧)、零售、工廠、車用、智慧物聯…等領域為主。以下藉由簡報內容，來快速了解這次NVIDIA到底「端出」什麼菜。 NVIDIA CEO黃仁勳首先向COVID-19抗疫英雄們致敬，並簡介其加入全球醫療合作夥伴的，詳細新聞可以。由於數據中心都是平行運算，除了CPU和GPU要夠快，其之間的通訊也要夠快才行，因此要搭配超強的智慧網卡與智慧交換器，才能將運算好的資料結果與其他處理器溝通，以完成各種密集運算。因此，NVIDIA先前併購Mellanox的用意，就是建構處理器之間的高速公路，也就是網路系統。Mellanox推出的高速智慧交換器與無線網卡，剛好可以滿足NVIDIA數據中心級伺服器在高速資料互連的需求。有關於這次發表的高速網卡產品，可以。由於當今繪圖工作站，需要更即時、更強大的加速運算伺服器，且還要能達到協作需求，因此NVIDIA推出了Omniverse全方位RTX Server，就是針對各種專業繪圖領域的企業所量身打造，賦予專業人士們來建造未曾存在於世界上的擬真場景。以下來看RTX伺服器在各領域的應用。＃影片＝https://www.youtube.com/watch?v=H0_NZDSqR3Y Marbles RTX的示範畫面，即時光追與DLSS的極致運用當今數據中心要將既有的大數據資料，透過ETL (擷取、轉換、載入)程序，然後再餵給伺服器去做Training (訓練)，最後才達到Inference (推論)步驟，將AI推導的結果呈現出來，要經過上述三步驟才行。後兩個步驟現在幾乎都是靠GPU來處理與實現，而NVIDIA也有對應的cuDNN和TensorRT解決方案，但在第一步驟則還是要倚靠CPU來處理，因此CPU也必須夠強大才行。不過現在這個情況即將改觀，NVIDIA也透過其RAPIDS資料分析平台，來幫Apache Spark 3.0進行GPU加速運算，也就是以往透過CPU來處理資料庫的作法，現在也能透過GPU來加速運算。因此NVIDIA的三層AI框架，幾乎可以透過GPU來加速。這次，NVIDIA GPU支援開源社群，加快Spark 3.0的運算速度，讓ETL與SQL的處理，能以飛快的速度，處理數百TB的海量資料，讓Adobe在Databricks上使用Spark 3.0訓練模型時，速度可以提高7倍！詳細內容可以。上面講的是第一層的大數據資料處理階段，接下來講第二層的訓練階段。這部份NVIDIA有推出其Merlin框架，是一款深度推薦應用框架，可協助零售業來分析消費者行為，並將其喜好餵給AI，以得到最確切的選購推薦。這部份當然也可以透過GPU來加速運算，透過ETL+Training都用GPU來算的話，速度比以前用CPU時還快到不可思議！第三層就是「推論」，NVIDIA也推出其新的Jarvis應用程式框架，詳細內容可。就是可以幫助零售業者來加速訓練。以往使用CPU來做訓練時，ETL階段就要2小時，訓練完要花1天半，若改用GPU的話，ETL階段只要3分鐘，而訓練也只要16分鐘，這真是快到不可思議的速度！以GPU加速的NVIDIA Jarvis應用程式框架，讓企業能夠透過影片與語音資料來為各自產業、產品和客戶打造客製化的先進對話式人工智慧(AI)服務，屆時就能打造屬於企業專屬的智慧對話機器人(類似Siri)，甚至可以圖像化，讓對話更加擬人化。正因為上述NVIDIA AI三個框架，都已全面運用到GPU來加速運算，在當今資料量越來越龐大的應用下，數據中心對於HPC的效能要求也希望能呈對比級數的增長，以減少伺服器的部署，同時降低TCO成本。為此，NVIDIA鄭重發表這次的主角，也就是A100 GPU，這款全新的數據中心級GPU，採用TSMC 7nm製程設計，Ampere架構，具備540億電晶體，內建HBM2記憶體，提供高達1.6 TB/s頻寬。並具有新的TF32 Tensor Core指令架構，比FP32快上加快！詳細規格可以。跟上一代Volta架構的V100相比，Ampere架構的A100 GPU，在BERT Training的效能快上6倍，在BERT Inference更快7倍。其搭配尖峰效能，在各式加速運算的效能，最高可以快上20倍！此外，老黃更從烤箱裡「端出」以A100 GPU所打造的DGX A100伺服器，詳細規格可以。此外，NVIDIA也打造700 Petaflops的次世代 DGX SuperPOD，幫助客戶在AI工作流程中運用經驗證的企業級軟體。這些SuperPOD都是配備DGX A100伺服器，以充分發揮伺服器房的坪效。最後，在嵌入式與邊緣AI平台方面，NVIDIA也推出EGX A100與EGX Jetson Xavier NX平台，以幫助智慧物聯、雲端AI、5G通信、車聯網、機器人等產業，建構一個雲端AI運算平台，賦予製造、零售、電信、醫療保健等產業即時的人工智慧應用。關於EGX的產品細節，可。至於EGX Jetson Xavier NX開發套件，細節可以。至於在車載應用方面，NVIDIA也展示搭配新的Ampere架構GPU，將讓自駕車的等級從第2級直接跳級升到第5級，也就是無人駕駛載客等級！以上就是GTC 2020的主題演講重點內容介紹，想了解更多GTC 2020主體演講細節，可移駕到。
專業繪圖卡C/P值爭霸戰：AMD正式推出Radeon Pro VII，主打6埠輸出，比Quadro便宜、加總效能也強！

自AMD於2019年CES首度推出7nm的Radeon VII之後，由於該顯示卡的規格強悍，可應用於專業繪圖工作站領域，同時也能兼顧消費性遊戲領域，也就是Radeon VII身兼繪圖卡與遊戲卡的功能，讓專業人士與效能狂熱玩家來選購。雖說Radeon VII規格強悍，採用7nm製程，但還是PCIe 3.0的架構，加上配置了16GB HBM2 (高頻寬記憶體)的設計，讓該卡不僅在遊戲應用下能擁有絕佳的效能提升，且應用在專業繪圖領域方面，也有不錯的發揮，當時定價為699美元。當時我們也有，可適合玩家與創作者選擇。然而NVIDIA早就推出GeForce RTX 2080高階遊戲顯示卡，在整體遊戲效能的發揮上更勝一籌，雖說同樣落在699美元價位，但其具備光追特效，因此還是在遊戲市場比較吃香！此外，在專業繪圖領域，NVIDIA也有Quadro產品線，搭配其CUDA架構，可發揮出絕佳的應用。只是其價位真是高不可攀就是了！為提供更低廉的選擇，AMD在Radeon VII發表的一年之後，也就是5月13日正式推出其衍生出來的新款專業繪圖卡(或稱工作站繪圖卡)產品－Radeon Pro VII，同樣採用7nm，但具備PCIe 4.0設計，並提供雙卡支援，同時具備6埠視訊輸出能力，再搭配AMD全新Radeon Pro Software for Enterprise驅動軟體，能發揮出超優異的雙精度浮點(FP64)效能，賦予CAE (電腦輔助工程)與HPC (高效能運算)行業絕佳的專業繪圖新體驗！很多人會問說遊戲卡(例如GeForce或Radeon RX系列)就可以做到的事，為什麼要花n倍的錢去買專業卡(例如Quadro或Radeon Pro系列)呢？其實只要是在這個行業的人(動畫特效、工程繪圖、工程模擬、結構可視化應用、專業VR、專業美工、醫學影像、高效能運算…等等)，都知道專業卡貴有貴的原因，主要可以從以下兩大特性來看。第一：專業繪圖領域，不只看FP32 (單精度浮點)而已，更要看FP64 (雙精度浮點)效能。從下表可以看到，遊戲卡或入門專業繪圖卡，可能在FP32效能還不錯，動輒十幾 TFLOPS，但是你一看FP64效能的話，就掉到GFLOPS等級。這樣的顯示卡，真的就是「顯示卡」，在遊戲畫面中畫出一般場景的圖時，還OK，但要畫出工程繪圖等級、有許多複雜細部零件的設計圖，就有可能發生浮點計算出錯而讓Ren圖畫出瑕疵的畫面，或是根本畫不出來！ ▼表各專業繪圖卡或消費性顯示卡的規格比較俗話說，時間就是金錢，一個客戶的案子若用遊戲卡來Ren圖，可能會花上一天的時間，且完成圖可能還有缺陷，準被客戶打槍。若改用專業繪圖卡，以其高速且大量記憶體，搭配更好的GPU核心來運算，就可能只要幾十分鐘就搞定。這就造就了不同級別的產品價位！(當然更高階的HPC與AI運算，則又是另一個級別就是了！) 第二：搭配的軟體相容性與優化程度！一些專業繪圖軟體、動畫特效軟體、工程繪圖軟體、內容創作軟體，為了要讓兼顧繪圖速度與品質，CPU通常要越快越好，若有GPU則能利用其硬體加速功能來加速繪圖。也就是說，這些生財工具軟體，除了要用高速CPU來執行之外，更要有GPU來搭配，才會畫得快、畫得精確。因此，這些GPU大廠不是只有推專業顯示卡而已，更要推出其專屬的驅動軟體集、API、工具包，來建構軟體生態圈，以讓這些生財軟體大廠加入支援，例如CUDA平台、OpenGL平台、OpenCL平台、ROCm平台等等。因此這些GPU大廠在軟體相容性與優化上，也花了不少努力，為的就是獲得這些專業軟體的相容認證，以讓專業人士採用。當然，這部份也都要算在產品成本內，再加上必須滿足專業繪圖卡客戶的各式支援需求，也因此，專業繪圖卡的售價自然就水漲船高了！正如上面所述，專業繪圖卡主要用途並不是拿來玩遊戲的，就算來玩遊戲也不一定快。這些卡擁有更高記憶體容量，並搭配Creator/Pro版本的驅動軟體，以及搭配專業繪圖工程軟體的軟體優化，才能發揮出高效能的專業繪圖水準。只是，真的售價不能再降低一點了嗎？為此，AMD正式推出Radeon Pro VII專業繪圖卡，來打造出中階售價，高階效能的高C/P值專業繪圖卡。先看其規格吧！從上表可看到，該卡其實跟Radeon VII類似，但採用PCIe 4.0架構，兩者皆採用台積電7nm製程設計，搭載16GB HBM2 ECC記憶體，並具備CrossFire雙卡效能加乘功能，透過其Infinity Fabric Link橋接器，即可將兩GPU串起來。在效能方面，配備60組CU (運算單元)，擁有3840組Stream Processor (串流處理器)，以及高達1TB/s的記憶體頻寬，在搭配Radeon Pro驅動軟體的發揮之下，可以達到13.1 TFLOPS的單精度浮點(FP32)效能，以及6.5 TFLOPS的雙精度浮點(FP64)效能。在視訊輸出效能方面，則配置6組miniDP埠，單埠可支援到8K 60Hz的輸出能力，若每埠都接顯示器的話，則具備4K 60Hz的輸出能力，因此對於需要大型視訊輸出應用來說，可以省下不少顯示卡的安裝！在安全性方面，Radeon Pro VII在GPU也內建跟CPU一樣的AMD Secure Processor，可搭配微軟作業系統的安全機制，讓顯示卡也能支援安全信賴平台，預先為防駭做好準備！至於在售價方面，Radeon Pro VII為1899美元，比其競爭對手(Quadro家族)便宜不少！且從其FP64的高效能表現，可說是一張具備超高C/P值的專業繪圖卡！由於網友經常開玩笑說，NVIDIA常常「負優化」，而AMD則是「戰未來」！意思表示前者顯示卡在搭配初期驅動程式時，效能還不錯，但安裝新的版本之後，效能可能下降(例如《刺客教條：奧德賽》遊戲)；而後者的顯示卡在搭配初期驅動程式時，經常好像無法讓一款遊戲發揮出更高的效能，不過透過其後續的驅動軟體優化，就能讓現有的顯示卡效能提升(例如。甚至前幾代的顯示卡，透過新版驅動程式還能玩最新3A遊戲，真可說是「戰未來」啊！此外，AMD更透過韌體升級，讓先前顯示卡的，從這裡也可看出AMD一直很佛心地在為消費者追求的效能做打拼！當然在專業繪圖卡領域，AMD也是一樣在戰未來，其專業版驅動程式也繼續為專業繪圖軟體做優化，目前平均每年將提升約14%的效能。以下就透過AMD的簡報，來看看這次Radeon Pro VII的優勢。
世界最大顯示卡「出爐」! NVIDIA於GTC 2020前夕，「端出」DGX A100超級電腦系統

受疫情影響，NVIDIA預計於5月14日舉辦的GTC 2020 (GPU技術大會2020)，將直接在線上演說，該大會將透漏下世代Ampere架構GPU，消費版本將採用10nm製程生產，而高階版本將可能採用7nm製程生產，讓其製程水準跟AMD一樣並駕齊驅。 NVIDIA目前主力的Turing架構GPU，分別導入其GeForce 16系列(包含GeForce GTX 1650 D5/D6版、1650 Super、1660、1660 Super與1660 Ti)、GeForce 20系列 (包含GeForce RTX 2060、2060 Super、2070、2070 Super、2080、2080 Super、2080 Ti)，以及Quadro專業繪圖卡系列(包含Quadro RTX 3000 Mobile、4000、5000、6000、8000)。至於在其高階AI應用方面，也有Tesla T4等GPU產品，以其內建的Tensor核心和RT (光追) 核心，來帶動遊戲產業、專業繪圖應用領域，以及高效能運算、深度學習、數據中心等行業，進入新一代的光追與高效能AI繪圖應用。然NVIDIA也在規劃其下世代的Ampere架構GPU，在消費性市場預計將命名為RTX 3000系列。在中，我們也透漏Ampere有可能採用三星10nm製程(8LPP)，並透漏其最高階的GA102 (GeForce RTX 3080 Ti)，效能將比現今TU102 (GeForce RTX 2080 Ti)的效能快高達40%。 ▼ NVIDIA Ampere GPU規格預測與效能對比除了遊戲卡之外，NVIDIA還是非常注重高階應用市場。以HPC部份，Ampere架構GPU，其代號將是GA100 GPU，採用台積電7nm+製程，預計將具備8192組CUDA核心，時脈為2GHz (可加速至2.2GHz)、1024組Tensor核心、130組RT核心、同時將採用 HBM2e記憶體，容量高達48GB，時脈為1.2GHz，使其尖峰效能達到36 TFLOPs，而該GPU的TDP(功耗)也將高達300W。＃影片＝https://www.youtube.com/watch?v=So7TNRhIYJ8 ▲ 採用Ampere架構的DGX A100超大GPU超級電腦系統「出爐」，老黃從其廚房的烤爐中「端出」然在GTC 2020大會前夕，NVIDIA已先在其YouTube官方頻道釋出採用Ampere架構的DGX A100系統預告片，可看到NVIDIA執行長黃仁勳將該系統從廚房的烤箱「端出」，讓這款具備世界最大GPU的系統「出爐」！由於DGX系統本來就是針對HPC與深度學習領域所打造的系統，需要有最快的運算效能，因此基本上「體.積.無.上.限」！從老黃將該系統端出來吃力的樣子，看起來非常的重啊！該影片的標題是「看老黃端出什麼菜？」而在敘述欄則標示「世界最大顯示卡，新鮮出爐！」看來，想要跟老黃比「大」，可能還得到後面站咧！ NVIDIA在其DGX系統中，從最早的Volta系列，到Tesla系統，直到最近推出的，配置了16顆Tesla V100 GPU，成為HPC AI級應用的性能猛獸，當時NVIDIA就稱之為世界最大GPU系統。至於這次老黃又端出來這款採用Ampere GPU所構成的DGX A100系統，看樣子將又要刷新上述DGX-2的世界最大GPU紀錄！其配置的GA100 GPU，將是Ampere系列中擁有最大顆GPU的產品(請Ponte Vecchio到旁邊站)，而且將有可能看到旗艦級的128組ShaderModel配置設計。從畫面可以看出，DGX A100的主機系統，上面配置了8顆Ampere GPU，並裝上超大散熱器，由於一般伺服器和HPC電腦系統的散熱設計大多是以被動式設計，因此可看到其與GPU相鄰的6個散熱器，可能主要是用於GPU之間，以及CPU至GPU之間的互連系統。搭配其CUDA軟體介面，將可能再次飆升其HPC領域的運算效能！無論如何，就等5/14的GTC 2020見真章了！
美國Aurora國家實驗室Exascale超級電腦配備揭曉，採用Intel Xe HPC ‘PVC’ GPU與Xeon Sapphire Rapids CPU，2021年開始部署 ft. 兩大CPU市場分析

這篇不是超級英雄之戰，而是超級電腦之戰！上週我們報導過Intel確認將推出，採用MCM封裝，該GPU核心就是Ponte Vecchio (義大利佛羅倫斯市內的一座老橋)，採用7nm製程設計，裡面電容數超過數以十億計，大小為3696mm²，寬度比一顆AA電池還大！令人大開眼界！由於先前，其合作內容是，Intel將與Cray一同建構起Exascale (百億億次級) 超級電腦，並於2021年部署！這次的超級電腦將採用兩組Sapphire Rapids Xeon處理器，以及高達6顆上述的Ponte Vecchio GPU，這些GPU將採用CXL (Compute Express Link)與OneAPI軟體堆疊來進行連接，以達到高效能運算目標。由Intel主導的Aurora超級電腦建構計畫，已於日前公布其，該電腦將配備上述的2顆Sapphire Rapids Xeon CPU，以及6顆Ponte Vecchio (PVC)的Xe HPC等級GPU，預計將達到1 ExaFLOPs的巔峰效能，該系統將在2021年正式於Argonne國家實驗室部署，此將成為地表上首台Exascale級的超級電腦！這款電腦由於配置了6顆PVC Xe HPC (7nm) GPU和2顆Sapphire Rapids Xeon CPU (10nm++) CPU，在各GPU之間將採用CXL (Compute Express Link)與OneAPI軟體堆疊來進行連接，系統採用統一記憶體架構(UMA)讓CPU和GPU的資料可以共用存取，以達到高效能運算目標。這項計畫中，Intel主要負責做CPU與GPU，而Cray (克雷電腦)則負責設計載體，也就是他們Shasta系統，其包含機架與機櫃，該機架支持各種CPU，並能針對伺服器密度、散熱效率，以及高效能網路頻寬進行不同比例的優化 (Cray可說是這次計畫的SI廠商)，讓Intel這個全新的處理器架構，能夠在高效能運算(HPC)應用中，穩定運作且發揮出全速效能。而在記憶體、儲存裝置與頻寬部份，先說記憶體好了，他們表示正在尋找能配置超過10 PB (1 PB = 1024TB)的系統記憶體，搭配Cray的Slingshot Fabric互連機制。已知Aurora超級電腦的每個運算節點，總共有8個Slingshot Fabric進行互連，而該電腦系統也會採用兩種不同的檔案系統，其中一個是DAOS (分佈式異步對象儲存)，另一個則是Lustre。兩者各有其優點，一個是高容量低頻寬，另一個則是相反，分述如下： (1) DAOS: 可支援大約 230 PB的儲存容量，頻寬超過25TB/s (2) Lustre: 可完整支援到150 PB 的儲存容量，頻寬大約1 TB/s 此外，在軟體方面，Cray也有自己的軟體堆疊層，可改善模組效率，同時提供統一的高效能互連機制。有鑑於其Slingshot是其第八代高速互連架構，具備許多HPC應用的必備特色，像是壅塞管理、僅3 hops的dragonfly系統，還有流量類別。同時還使用Rosetta高頻寬交換器，能提供高達25.6Tb/s的頻寬(單一方向為25GB/s)，以符合Exascale等級的運算需求。 Intel Xe家族，依照等級高低可區分成最高階的HPC、中階的HP，以及消費性的LP。先說最高檔的HPC吧！這次的Ponte Vecchio (PVC) GPU，將採用7nm製程設計，搭配其Foveros 3D封裝技術，並以MCM的封裝設計，晶圓面積勢必不小。此外，每顆MCM GPU將通過EMIB (嵌入式多晶片互連橋接，Embedded Multi-die Interconnect Bridge)連接到高密度HBM(高頻寬記憶體)之DRAM封裝，並在旁邊放置一個更快速的Rambo Cache，該快取也是透過Foveros來進行連接。再搭配Cray的Slingshot提供節點之間的互連，便可透過Intel Xe Link將6顆Xe HPC GPU內部互連起來！由於Intel的Xe HPC GPU，將具有幾千個EU (執行單元)，目前已知Xe LP GPU有96組EU，每個EU共有8個核心，因此相乘起來共有768組GPU核心。目前Intel在Gen 9.5和Gen 11的GPU上，每個切片上面擁有8組EU，同時包含8組ALU (算術邏輯單元)，而在Gen12 GPU的子切片中，其EU裡面有點像是NVIDIA在GPC裡面的Shader Model (SM)單元，或是AMD在Shader Engine裡面的CU (運算單元)的組成。因此這樣演化下去，將可以看到大量由許多子切片所組成的超級切片。簡單來說，1顆具備1000個EU的GPU晶片，裡面就含有8000組GPU核心，不過有可能更多，因為先前有看到中階的Xe HP GPU以4顆堆起的大GPU，就內建了2048個EU (相當於16384組GPU核心)的設計，預期高階的Xe HPC GPU將可能更多，晶圓面積也將更巨大！由於Xe HP GPU具備可變動向量寬度指令集，例如GPU專用的SIMT，以及CPU專用的SIMD格式，兩者搭配起來將有最大效能。而根據Xe HP GPU的單顆、雙顆、四顆搭起來之後，其效能大概可以預估如下： (1) Intel Xe HP (12.5) 1顆GPU: 512 EU (約4096核心，12.2 TFLOPs，150W) (2) Intel Xe HP (12.5) 2顆GPU: 1024 EU (約8192核心，20.48 TFLOPs，300W) (3) Intel Xe HP (12.5) 4顆GPU: 2048 EU (約16384 核心，36 TFLOPs，400～500W) 至於高階的Xe HPC GPU，Raja Koduri在Intel開發者大會提到，HPC將可達到1000個EU，相當於單顆就有8000個GPU核心，且提供40倍的雙精度浮點運算能力。其中，每個EU是透過新的可擴充式記憶體fabric架構來串連起來，這個新的互連架構就叫做XEMF (即Xe Memory Fabric)，可提供數組高頻寬的記憶體通道。跟Xeon CPU一樣，Xe HPC GPU也需要配置具備ECC功能的記憶體來運作。此外，Xe HPC還包含一個Rambo Cache，是一個超大型的快取架構，負責將多顆GPU串連在一起。此外透過該快取的巨大級記憶體頻寬，可以持續性的在雙精度運算中，提供尖峰的FP64運算效能。這樣在進行密集的AI運算時，能夠快速且有效的完成各式工作。至於在製程方面，因為10nm升級到7nm，所以在GPU裡面也獲得一些關鍵性的提升，包含：7nm製程擁有10nm的兩倍密度、Die內部節點優化、設計準則減少4倍、採用EUV (極紫外)光刻機製程、採用下世代Foveros與EMIB封裝。在伺服器處理器方面，Intel這次推出的Sapphire Raids Xeon伺服器處理器，將採用10nm++製程，將可能採用Willow Cove核心架構，以取代先前的Sunny Cove架構。此外，這次的Sapphire Raids Xeon處理器，搭配其最新的Eagle Stream晶片組平台，將首度支援到DDR5記憶體，以及PCIe 5.0架構 (對！直接跳到5.0了，不跟你AMD的4.0喇賽)。說到這次新的Eagle Stream平台，將採用全新LGA 4677腳位，以取代先前Whitley的LGA 4189腳位(支援Cooper Lake-SP與Ice Lake-SP處理器)。(是的！腳位一直改！) 若跟AMD相比，AMD將於2021年推出EPYC “Milan”伺服器處理器，採用7nm Zen 3架構、支援PCIe 4.0與DDR4。而要是Intel不Delay的話，其2021年推出的Sapphire Rapids Xeon CPU雖說採用10nm++製程，且支援PCIe 5.0與DDR5，記憶體將支援到8通道，雖說製程落後(10nm++)，但規格上卻領先，將可能又把AMD的Milan往下踩。也因此，AMD可能要加緊推出其EPYC “Genoa”，採用新的SP5腳位設計，將以5nm製程設計，支援DDR5與PCIe 5.0等新規格，來與Intel正面對戰！上述只的是Intel於2021年必須交付的Aurora exascale系統。當然其實除了Intel之外，還有許多超級電腦標案，包括先前2018年IBM與NVIDIA合作的Summit與Sierra標案，分別擁有200與125 petaflops尖峰處理能力。而2020年AMD與NVIDIA即將交付的Perlmutter超級電腦，則採用上述Zen 3架構EPYC “Milan”處理器與NVIDIA的Tesla GPU，預期可以達到100 petaflops的處理能力，但這些案子都是屬於Pre-exascale等級的超級電腦標案。至於比較具有可看性的Exascale超級電腦標案中，除了上述Intel標到的Aurora標案之外，AMD也有標到，由是AMD負責CPU與GPU的建構，Cray負責系統、機櫃與互連。在同樣建構Exascale超級電腦的計畫中，AMD表示將採用最新的EPYC 7000處理器，搭配自家Radeon Instinct GPU，來組成1.5百億億次級以上(1.5 exaFLOPs)尖峰處理能力的超級電腦，以用來處理天氣、亞原子結構、基因組學、物理學等科學進行模擬、建立模型等應用。這個案子的CPU和GPU都是AMD自己包辦！除此之外，HPE (慧宇)也於今年3月標到，將與AMD合作(為什麼不選Intel? 耐人尋味!)，共同打造2百億億次級以上(2 exaFLOPs)尖峰處理能力的超級電腦，並預定於2023年初部署，以提供美國國家核子安全總署(NNSA，National Nuclear Security Administration)使用，該超級電腦將主要用在核子武器建模 (疑? 不是拿來做COVID-19研究喔?!)。從上述的Exascale超級電腦標案中，可看出AMD與HPE合作一起拿下的Frontier與El Capitan兩個標案，分別為1.5或2 exaFLOPS等級的超級電腦標案，相較於Intel拿到的Aurora標案僅 1 exaFLOPS，看來AMD陣營還是略勝一籌！只是2021年之後就都要交出成績單了，屆時就要看哪一家在Super Computing的效能競賽中獲得優勝了！誰能成為Super Computing業界中的SuperHero，目前還不曉得。只能說，2021年的伺服器市場戰役，將會非常精彩！
專訪夢想動畫公司！配置高效能GIGABYTE Server，以技嘉伺服器建構首屈一指的AI運算與遠端桌面動畫應用！

受益於電腦效能提升的一日千里，如今CG (電腦繪圖)的應用可說是越來越廣泛與精深，舉凡是電影、廣告、音樂電影、網路影片、遊戲等等，都可以看到電腦動畫的神乎其技，將栩栩如生與逼真的畫面呈現在世人面前，甚至可以與虛擬世界的人物進行互動，帶領人類進入如阿凡達電影般的奇幻境地。為打造出專業級的CG殿堂，夢想動畫 (MoonShine Animation)於2012年成立，是一家以藝術家為中心的台灣本土動畫與視覺特效公司，目前有超過150位員工，擁有導演、專案經理、概念設計師、動畫師、合成師、特效師、研發工程師、互動設計師…等職位，設計出多元的作品，涵蓋視覺特效、動畫、技術研發、遊戲、VR與互動…等領域，並從事文化內容再造等業務。該團隊承接過國內各大公司的動畫製作案，並參與過電影之視覺特效，為國內首屈一指的動畫製作公司。為進一步了解動畫公司的辦公室是長什麼樣子，以及動畫公司如何配置其電腦裝備，並利用其新購入的技嘉伺服器來擔任什麼樣的角色，以下PCDIY!將帶您進入位於南港的夢想動畫公司總部，專訪創辦人林家齊先生，來深入了解動畫與視覺特效領域，以及他們電腦的應用配置。大家對於動畫公司所經營的業務範圍可能比較陌生，有鑑於此，林家齊介紹了夢想動畫的主要業務，涵蓋了：概念圖、海報、3D廣告、動畫、互動，以及文化內容再造，這些都屬於動畫公司會製作到的內容，隨著近年來不少學生與社會人士對於動畫製作上也有興趣，該公司更舉辦線上課程，讓學員們可以透過該公司的教學課程，來吸收到動畫相關的知識！由於夢想動畫承接過不少大廠委託設計的各式知名動畫作品，這些成品讓人看了之後覺得非常令人激賞，也深深感受到夢想動畫高深的製作功力。相信有不少玩家想知道，以這些作品來看看，需要花到多少人力與時間來開發！林家齊表示，由於動畫公司除了與客戶直接聯繫之外，還會與其他廠商如製作公司、代理商互相往來，因此一般大多會看專案的大小與金額來設定。以粗略來計算，一般動畫案子大約需要20～30人，為期半年的執行時間，前期的討論與定稿花比較久，真正製作期大約3個月。至於比較知名大大型案子，他以先前幫國內某知名航空的動畫製作案子為例，該案子整體需要動員到150人月的人力配置，因為執行期間非常長，從概念發想到實際完成，大約一年左右。由於前期設定、溝通、討論到視覺定案，可說是非常繁瑣的過程，因此會花比較久的時間來執行，真正擬定好角色、材質設計、視覺定稿完成之後，後續的動畫製作期間就可以非常快了。而在製作的過程中，許多都是要透過想像與實際的結合，來做出生動的畫面。以飛機機艙內的廁所或安全門為例，由於實體並不存在，製作小組必須依照真實物體的配色來刻劃，且必要的細節都要非常接近真實比例，以及結構上合理性，才會讓客戶與觀眾感覺到有真實感。林家齊也簡介其公司的內容簡報，以介紹夢想動畫的辦公室配置、歷年作品、拍攝展示、以及近年正研究中的AI輔助動畫設計。由於當今動畫特效越來越進步，不少產業紛紛導入AI (人工智慧)來幫助動畫製作，這部份，夢想動畫也有導入。林家齊簡單說明其作品製作時的大致流程。首先，夢想動畫在內湖有個虛擬攝影棚，可進行3D動作捕捉(MoCap)，以與遊戲進行串接。在動畫的製作過程中，人物必須以真性情的面貌呈現，但電腦並不曉得怎麼揣摩人類的表情，因此這部份可以透過深度學習的方式，訓練AI幫結果繪製出來。如上述的幾張圖中，有郭雪湖畫風的膠彩畫，透過AI的訓練之下，便可繪製出擬真的畫面。這些效果看起來並不是濾鏡，包含筆觸等都會學習。而夢想動畫也期望在未來，透過新科技的幫助，來改變一些做法。再來是預視模擬畫面，以Styleframe單張畫格的風格設定，再搭配我們所要呈現出來的畫面，透過電腦AI的拼湊之下，即可呈現出初期的動畫，就連光線與陰影細節都能清楚描繪出來！此外，2D動畫也能透過Toon Shader的方式，搭配真人動態捕捉，來成就出類似日式動漫的風格。當然像是人臉模仿、深偽(Deep Fake)表情技術，透過AI也是可以做到的。簡單來說，AI可讓作品還沒上色前，就能模擬出成品的樣子，減少先前必須一張一張去細修的工作，讓品質更加分。以AI為主的動畫製作，雖然不能完全取代人工製作，但可以輔助許多以往必須花費大量人力去製作的畫面(像是先前沒看過的畫面，或是世界上沒有的場景等)，只要賦予一些想像空間，餵入作家的筆觸資料與畫風，AI就能透過這些學習資料，繪製出想要繪出的畫面。當然，AI也可以用來將畫面從2K轉成4K解析度，由黑白轉彩色！可說是以破壞式創新勾勒未來動畫的製作方向，不但能解決以往不能解決的問題，並且加速成品完成，可說是未來動畫製作的一項重大利器！不少動畫都非常仰賴「高效能運算」(HPC)伺服器，來加速圖像的計算與處裡，包含視覺特效、光線追蹤、影像後製…等等。那麼夢想動畫在HPC伺服器上面，是如何配置的，以及其規格如何？林家齊表示，以往採購的主要考量，大多是以CPU的核心數量為基準，也就是「時脈*核心數/價格」的公式，來評量機器的採購準則。不過隨著近年來，考量到CG製作為主，也會參考CineBench的跑分，來計算出效能比。這些都算是典型的評量方法。近幾年AI動畫的運用需求越來越高。在機器配置上，除了CPU效能比之外，GPU效能比也被列入評量範圍。GPU效能比稍微複雜一點，像是以AI運算為主的電腦，就需要搭配超高視訊記憶體的GPU才行。例如人臉模擬的話，就非常吃記憶體，若在記憶體太小的GPU (如8GB以下)做訓練，可能要30天才能跑完。而改用48GB等級的專業GPU，大概只要1天就可以搞定！從這裡就可以看出效能差距的級別！林家齊表示這次購入技嘉G191伺服器，主要有兩個用途，原本的用途主要是用來做AI運算的，由於一般市售1U的伺服器，最多只能塞2張繪圖卡。而技嘉這款伺服器能在1U的高度塞入4張專業級的繪圖卡，是以往沒看過的設計，不僅大幅省去伺服機櫃的空間，也讓效能提升。此外，配置雙路處理器，能發揮更多執行緒(共36核心72執行緒)，搭配風流設計採前導後出，將散熱效率最大化，在做HPC運算時不僅可以能發揮最高效能，並可達到最佳能效。因此夢想動畫購入技嘉G191伺服器，主要目的就是用來當做AI運算的伺服主機。在規格方面，夢想動畫新購入的技嘉G191-H44伺服器，安裝了Intel第二代Xeon Gold 6240可擴充處理器兩顆，提供36個核心72條執行緒；在GPU方面，則是安裝了NVIDIA Quadro RTX 8000繪圖卡(48GB GDDR6) 4張；系統記憶體則是在24組DIMM上安裝32GB的DDR4記憶體，總數達到768GB；至於儲存裝置則安裝4顆2TB的SSD為主(另有其他儲存伺服器做儲存，此伺服器主要用來做高效能運算)，成為公司最強的AI運算專用伺服器。那麼為何沒有安裝到Tesla等級的繪圖加速卡？林家齊表示那屬於不同的應用級別，Tesla屬於大量AI運算的領域，而選用Quadro，一方面除了前述人臉模擬需要用到高記憶體繪圖卡才行，且Quadro RTX具備光線追蹤特效，可加速動畫繪製，因此公司裝到這個級別，已可符合自家Render Farm (算圖農場)的需求。至於辦公室的員工電腦，則配置到一般GeForce的遊戲顯示卡就可以了！主要是GeForce在本地端執行動畫軟體工具時，就有足夠的繪圖效能提升效果，符合絕大多數應用需求。購入技嘉超強伺服器，原先規劃用來做AI運算應用，但由於今年的疫情爆發，使得大型動畫專案紛紛延後，必要的話就連員工也得居家工作，屆時不可能每個人的家裡都有很強悍的電腦能拿來製作動畫，準備高效能電腦給員工的話又不好管理。因此，林家齊與其IT部門一起挖掘出這款技嘉伺服器的第二用途，也就是雲端桌面應用！林家齊透漏，之所以會選擇Quadro繪圖卡做為雲端桌面/虛擬桌面架構(VDI)應用，讓一般入門級Mini PC (迷你電腦)或Thin Client (精簡型電腦)也能透過網路，連接到技嘉伺服器執行遠端桌面進行動畫製作，主要是考量，目前的遠端桌面解決方案(如AnyDesk、TeamViewer)都沒有經過最佳壓縮處理，或運用到硬體的加速優勢，使得操作上會有點卡卡的！而Quadro繪圖卡搭配其驅動程式，不僅可以做到即時的視訊輸出，再加上Quadro RTX 6000以上等級專業繪圖卡具備GRID (虛擬化GPU運用)功能，搭配Intel多核心處理器有針對Adobe相關創作者軟體優化，以及許多專業繪圖都有提供NVIDIA的CUDA硬體加速功能，就連vGPU也能加速，這樣一來，就能發揮出相輔相成的效能加乘效果！這樣一來，就能建構GPU加速的遠端桌面環境，成為最佳遠端桌面繪圖伺服器。林家齊表示，目前技嘉伺服器，變成以運用於虛擬桌面架構(VDI)為主，讓在遠端工作的員工，只要在家裡用微軟RDP (遠端桌面)工具，就能連回公司的雲端桌面，並執行那些會吃GPU資源的生財軟體，即使在家也能進行動畫製作，至於一般沒有要製作動畫時，也是可以透過RDP連回公司電腦，來進行安全上網與文書工作。以目前的規畫，技嘉伺服器在VDI資源上共有72個vCPU (虛擬機CPU核心)，近768GB的vMEM (虛擬機記憶體)，以及4顆vGPU (虛擬機GPU數)相當於共有18432個CUDA核心，與384GB的vGPUmem (虛擬機視訊記憶體)，因此林家齊將其分割成24組動畫製作級別虛擬機帳號或是192組一般文書工作帳號，並透過動態調配的方式來分配資源給需要的員工使用，讓伺服器應用效益最大化！以下是我們PCDIY!估算的虛擬機資源分配結果。 (1) 24組動畫製作級別虛擬機帳號：每個帳號平均可享用約3 vCPU、32GB vMEM、768個CUDA核心，以及16GB vGPUmem，主要給動畫製作使用 (2) 192組一般文書工作帳號：就是將動畫製作等級的VDI切成8個資源，變成每個帳號享有約1GHz的vCPU資源、4GB的vMEM資源、96個CUDA核心，以及2GB的vGPUmem，主要給一般上網與文書工作使用，可以播放影片透過上述的資源切割，技嘉伺服器就相當於是24台繪圖工作站的效益，讓員工可以遠端工作。至於上述提到的也可以等同於192部文書工作機的資源，其考量是為避免受到駭客或有害軟體(例如勒索病毒)的攻擊，公司端的本地端電腦只提供Intranet (內網)連線功能，必須用RDP連接到技嘉伺服器的帳號，才能連到Internet (外網)進行上網或其他對外溝通。這樣分層管理不僅可以抵禦病毒入侵，IT部門也容易管控以打造安全的工作環境，提升公司資安等級！接下來看看夢想動畫的電腦教室，這裡就是VDI應用的最佳實作場域了。這裡的每台電腦都只有配備簡單的螢幕、鍵盤與滑鼠，並連到一台早期的智慧電腦棒(Compute Stick)，這款電腦棒算是2016年的老機種了，內建Atom Z8300處理器，搭載DDR3 2GB與32GB eMMC記憶體，並配備Win10 Home 32bit版本，算是最基本入門電腦。林家齊透過這樣的超精簡型電腦，來展示連接到技嘉伺服器，並執行3D特效製作軟體Houdini FX進行多組3D模型的即時繪製。結果畫面呈現非常即時！場景變換流暢不卡頓，學生們可透過這樣的方式來學習與創作，就算在家也能享有一樣的體驗。＃影片＝https://www.youtube.com/watch?v=X0B_Mqi4xVI ▲林家齊現場展示以該精簡電腦，連接到其技嘉伺服器，執行3D特效製作軟體Houdini FX，以進行多3D模型的即時繪製至於導入這台技嘉伺服器的效益，對於生產力的提升有什麼幫助？林家齊表示，透過將伺服器切分成24台動畫製作級別虛擬機後，平均每部VDI成本大約2.5萬元，這樣的配置，是繪圖工作站的等級，員工不僅可以在自己的電腦上進行動畫製作，回到家也能延伸其使用體驗，且必要時，公司亦可根據執行的案量來動態調配虛擬機資源，算是大大提升員工的工作效率。一般台灣動畫公司多以動畫代工(OEM)為主要業務，承接客戶的多種動畫案，這些案子可能會拆分到多家動畫公司，且有NDA約束，執行的內容都不可對外公開，甚至無法列出動畫師的名字，如同資訊工人一般的被忽略掉，長期下來對員工的身心發展也會有影響。因此林家齊在一開始成立夢想動畫時，其案子類型就定位在不以OEM為主，而是以偏向以主創性製作(ODM)為主，包含自己擔任導演或是創意發想，甚至可以參與設計與故事腳本，產品共同掛名，以展示出自己的品牌，夢想動畫期望在客戶的幕後團隊列表中，將自己站在產業鏈的前端。從上述的訪談當中，可以發現夢想動畫不只在實現夢想，更以務實之態度，來打造專業級的動畫殿堂，同時也立志成為動畫產業的翹楚，在科技與電腦的搭配上更是令同業刮目相看。以這次導入技嘉G191-H44的1U高效能伺服器為例，其搭配雙Xeon處理器與NVIDIA Quadro繪圖卡，從原先打造AI運算為主，到後來轉換成以VDI應用為主，實現讓員工遠端動畫製作以及安全上網的絕佳工作環境，同時也為同業先鋒，開創遠端工作的無限可能。當然不僅僅是為了防疫需求，夢想動畫更計畫在未來高雄分公司的電腦配置上，也採用這種遠端VDI方式，透過從高雄連回台北的方式，打造出任何裝置、任何地點與任何時間都能進行動畫製作的環境。廠商名稱：GIGABYTE Server 技嘉伺服器 - GIGA COMPUTING 技鋼科技股份有限公司廠商電話：0800-079-800 廠商網址： →更多的【PCDIY! Server Workstation 伺服器工作站 / HEDT 高階桌機主機板 / WS 工作站主機板】： →更多的【PCDIY! CPU / 中央處理器】： →更多的【PCDIY! MainBoard 主機板 / Gaming M/B 電競主機板 / Creator M/B 創作者主機板 / HEDT 高階桌機主機板】： →更多的【PCDIY! DRAM / 記憶體 / 超頻記憶體模組】： →更多的【PCDIY! SSD / 固態硬碟】： →更多的【PCDIY! NAS / 網路儲存裝置】： →更多的【PCDIY! Enterprise 企業級商用 - 路由器 / 無線路由器 / AP / 交換器 / IIoT / 防火牆】：
Infortrend 橫向擴展 NAS 機種支援 SMB Multichannel

普安科技® (股票代碼：2495) 為業界領先的企業級資料儲存專家，旗下的橫向擴展 (scale-out) NAS EonStor CS 機種最新採用 SMB Multichannel 功能。透過 SMB Multichannel，EonStor CS 叢集可與用戶端裝置藉由聚合網路介面卡 (NIC) 建立多個同時網路連線。對於效能需求極高的應用而言，如多媒體影音產業常見的 4K 影像剪輯、廣播或即時影音串流以及高效能運算 (HPC)，則可大幅增加可用頻寬、資料儲存效能及容錯能力。 EonStor CS 為橫向擴展 (scale-out) NAS，可在單一叢集中擴充至 144 個節點，總體資料傳輸量超過每秒 100 GB 且儲存容量可達 100 PB。啟動 SMB Multichannel 後，SMB 3.0 用戶端能夠透過多個路徑存取 CS 儲存空間內的資料；與透過單一路徑存取資料時相比，此功能不僅可聚合網路頻寬，更可增強網路容錯能力。 SMB Multichannel 帶來更高的可用頻寬及系統效能，有助於處理效能需求極高的工作負載。此功能可聚合多個網路介面，透過多個網路通道同時讀取及寫入資料，顯著提升整體效能。此外，更能夠自動偵測故障發生，並將資料傳輸程序移轉至其他正常運作的網路通道處理，確保連線不中斷、強化系統可用性。普安科技產品企劃部資深經理李金溪表示：「加入 SMB Multichannel 功能後，不僅可以提高 EonStor CS 橫向擴展 NAS 效能，更能確保網路服務不中斷，相當適合進行各種時間敏感 (time-sensitive) 及高可用性 (high availability) 應用。例如，在多媒體影音產業中，剪輯4K 以上高畫質影片時需要極高的網路頻寬。透過 SMB Multichannel 連接多個網路介面後，便可以順利進行多人協作，無需擔憂頻寬不足或系統停機的問題。」
AMD第二代新款EPYC 7Fx2家族伺服器追加上市，主攻8、16、24核市場，提供C/P更高的HPC運算效能

AMD自2019年8月8日正式發表，採用Zen 2架構、7nm製程，並支援PCIe 4.0規範，最高達64核心、128執行緒，提供HPC (高效能運算)環境絕佳的運算效能，讓業界刮目相看！隨著AMD第二代EPYC處理器的上市，，以更優勢的價格來供應企業用戶使用。如今，AMD可說是逐漸在伺服器市場嶄露頭角，隨著伺服器的主流市場逐漸往8核至20核心來發展，AMD也乘勝追擊，於2020年4月14日再推出新的EPYC 7Fx2家族伺服器處理器共三款，包括EPYC 7F72 (24核心)、EPYC 7F52 (16核)與EPYC 7F32 (8核心)等三顆全新CPU，以提供比自家7002同級產品更高的運作，以更具C/P值的設計，讓企業可以加速導入。先前AMD推出的EPYC 7002系列伺服器處理器(代號‘Rome’，羅馬)，採用Zen 2架構，並以全新7nm製程生產，能支援PCIe 4.0規格，以及DDR4-3200記憶體，賦予優勢的I/O與記憶體頻寬，且在L3快取提升了4倍，使效能比上一代EPYC快高達23%的IPC (每時脈執行指令數)。 EPYC不僅從架構上提升，更提供先進的安全功能，能幫助客戶保護最重要的數位資產。最高版本的EPYC 7002系列(7742/7702/7702P)擁有高達64核心、128執行緒為例，導入AMD EPYC平台，相較於競爭對手平台，能有效降低TCO (總擁有成本)達50%。後來EPYC 64核心家族新增一個7H12的型號，為旗艦款，擁有更高時脈效能，但TDP也增加到280W，此外在今年2月還新增了入門款64核心的EPYC 7662，時脈較低，且TDP也比較低。至於32核心也有新的7532，時脈降低一些，但L3快取容量倍增。為加速伺服器市場生態系的動能，AMD EPYC已陸續與亞馬遜、Google Cloud、微軟Azure、IBM Cloud、Oracle Cloud、騰訊雲等雲端業者合作，且先前更標下了美國能源局在Oak Ridge國家實驗室的Exascale超級電腦標案，將於2021年打造出1.5 ExaFlops等級的超級電腦－Frontier，此外，更獲得Lawrence Livermore國家實驗室的導入，以及美國各公家單位的採用。由此可見AMD可說是在伺服器市場初露曙光！由於EPYC 7002家族，最高檔的7742雖說有64核心，但價位其實滿高的，也許效能很強，但耗電量也高，因此不一定符合TCO成本。以一般數據中心、密集運算來說，目前大多的密集性運算工作，其實很多時間是不太需要用到那麼多核心數的，此外像是虛擬機應用方面，像VMware這類的軟體是以單顆處理器的核心數來計價，越多核心的費用也越高()。因此對於整體部署成本來說，其實從記憶體要裝多一點之外，CPU內部的L3快取容量增大，對於伺服器在處理大量運算時，效能提升也比較明顯。正因此，為達到最佳部署甜蜜點，AMD再次推出三款EPYC 7Fx2家族伺服器處理器，比自家同核心數級的7002系列的時脈和快取容量還要高，因此7Fx2家族將擁有更好的效能表現。以下是7002與7Fx2家族的產品規格列表。 ▼AMD第二代EPYC伺服器處理器 (代號Rome)規格列表 (橘色字為這次發表之新品) 從上表可以看到，這次7Fx2家族，最高等級的EPYC 7F72，擁有24核48緒，時脈為3.2～3.7GHz，L3快取增加到192MB，隨之而來的TDP比較高，達到240W，相較於7402來說，各方面的規格都更好，值得密集運算應用伺服器使用，當然價錢也比較貴一點點就是了！至於主流的EPYC 7F52，擁有16核32緒，時脈比7302還高，達到3.5～ 3.9GHz，L3快取更是倍增到256GB，比7F72還高，再加上16核32緒裝2顆之後總共為實體32核心，算是一套VMware的授權費，因此AMD認為這顆伺服器處理器不僅時脈更高，將能成為虛擬機器的最佳選擇，因此在售價上將7F52訂得還比7F72高，不過整體來說還是比競爭對手的低就是了！至於入門的EPYC 7F32則擁有8核16緒，時脈比7262高一些，達到3.7～3.9GHz，但L3則維持不變，售價卻比7262多近4倍！主打高效能入門伺服器市場！上述的EPYC家族都可以搭配既有的EPYC 7002專用伺服器主機板使用，只要更新BIOS即可支援新的7Fx2處理器，至於TDP方面由於伺服器主機板皆能支援到280W的功耗，因此要應付TDP最高到240W的7Fx2家族，絕對是綽綽有餘！因為這次EPYC 7Fx2家族，擁有更高效能、更多的L3快取，更可以雙路配置，讓伺服器效能再往上飆升，因此有越來越多一線伺服器大廠，紛紛導入7Fx2家族處理器，來建構各式伺服器產品。以下就透過簡報來看看AMD這次的出牌吧！
AMD第2代EPYC處理器為IBM Cloud全新裸機伺服器提供強大效能，全新方案為每台伺服器提供超過2倍的可用裸機核心數量，進一步擴大IBM裸機伺服器的效能輸出

AMD（NASDAQ: AMD）宣布IBM Cloud最新裸機伺服器（Bare Metal Servers）將採用AMD第2代EPYC處理器，以強化其全球基礎架構。隨著AMD EPYC 7642處理器加入其雲端陣營，IBM的裸機方案能夠擁有更高的運算效能。這些新款裸機伺服器目前已上市，為IBM Cloud首款搭載AMD第2代EPYC的產品，專注於各種現代工作負載所需的運算能力與效能，其中包括資料分析、電子設計自動化、人工智慧，以及虛擬化與容器化（containerized）工作負載。 AMD全球資深副總裁暨資料中心與嵌入式解決方案事業群總經理Forrest Norrod表示，AMD第2代EPYC處理器提供至關重要的效能，滿足雲端服務供應商對關鍵工作負載的需求，其中包括核心數量、擴充性以及吞吐量。我們很高興將AMD第2代EPYC處理器的優勢延伸到IBM Cloud的全新裸機方案，協助客戶解決現今各種涉及密集運算的工作負載。 IBM雲端基礎架構服務部門總經理Satinder Sethi表示，我們非常高興推出採用AMD第2代EPYC處理器的全新IBM Cloud方案。藉由這些全新處理器，我們可以提供IBM Cloud客戶更多元的選擇與靈活性，挑選最適合的平台，以滿足當前要求最嚴苛的工作負載需求。我們期盼未來能持續為我們的客戶提供創新成果與價值。 • 每伺服器平台擁有96個CPU核心 • 基礎時脈頻率為2.3GHz，最大頻率可提升至3.3GHz註1 • 每插槽配置8條記憶體通道，提供卓越的記憶體頻寬 • 可支援高達4TB的記憶體組態 • 提供多達24個本地儲存硬碟 • 作業系統可選用RHEL、CentOS、Ubuntu以及MS Server • 每月按使用量計費 • 可透過全球IBM Cloud Catalogue、API或CLI等通路訂購新款裸機伺服器已配置於北美、歐洲和亞太地區的各大IBM資料中心。採用AMD EPYC 7642的伺服器可以透過IBM Cloud全球型錄平台、API或CLI訂購，並以按使用量的月費模式使用。請參閱IBM Cloud來開始構建採用AMD第2代EPYC處理器的裸機伺服器。
刷新紀錄！華碩1P／2P伺服器奪578項SPEC標準評測佳績

華碩今日宣布旗下伺服器本月初於國際性標準性能評試機構—SPEC(Standard Performance Evaluation Corporation)的標準測試最新結果中勇奪578項世界紀錄，不僅創下歷來之最，獲第一名佳績的項目數更以30%差距領先競爭對手，持續穩居伺服器系統、伺服器主機板、工作站與工作站主機板的領導品牌寶座。華碩伺服器搭載Intel®／AMD®處理器，並採用獨家效能調校技術，能提供風馳電擎的強大運算效能，不論是AI人工智慧、高效能計算(HPC)、資料分析與基礎架構管理等應用，一切皆能游刃有餘，為企業用戶打造極臻完美的運算解決方案。專為千億級高速浮點運算而生的「ESC8000 G4」機架型伺服器搭載第1代與第2代Intel® Xeon® Scalable處理器，於「SPEC CPU® 2017」標準評測項目中一舉囊括192項世界紀錄；其中，採用Intel® Xeon® Scalable Platinum 8280L處理器的ESC8000 G4伺服器，亦於標準評測項目榮獲最高分數。ESC8000 G4不僅具備高密度運算能力與靈活擴充設計，也支援Intel® Optane™持續性記憶體，能讓密集運算應用效能巨幅躍進，加上內建的ASMB9-iKVM伺服器管理方案，自由切換單開或雙開複合模式，大幅提升控管效率，滿足用戶對於AI訓練、高效能計算(HPC)、資料分析、資料中心運算等應用，將強大運算效能推升至嶄新境界。兼具靈活擴充與出色效能的「RS300 E10」機架式伺服器於「SPEC CPU® 2017」標準評測項目中，一舉寫下含括「SPECint 2017」與「SPECfp 2017」在內的96項世界紀錄，其配備Intel® Xeon™ E2200處理器、四個Intel® 乙太網路連接埠與高度擴充性等優異特色，能提供強大的運算能力、減少延遲，進而推升整體效能表現，適合入門級伺服器、伺服器訊息區塊系統、邊緣運算與其他應用，為中小企業用戶的伺服器首選。搭載AMD® EPYC™ 7002處理器的1P與2P伺服器於「SPEC CPU® 2017」標準評測項目中，一舉拿下102項世界紀錄，而1P伺服器「RS500A E10」與2P伺服器「RS700A E9 V2」於標準測試分別獲得64項與38項的世界第一；其中，2P伺服器「RS700A E9 V2」最高支援64核心、128執行緒、8通道DDR4、128個PCIe® 4.0通道，能加速資訊傳輸與減少運算時間，輕而易舉完成AI訓練、架構虛擬化、虛擬桌面 (VDI)、軟體定義等應用，滿足企業用戶的多功負載、頂尖效能等運算需求。為提供企業用戶卓越出眾的伺服器效能表現，華碩研發獨家效能調校技術，含括核心最佳化、引擎增壓、工作負載預設集三大特色。「核心最佳化」技術能大幅提升多核心運算效能、減少頻率切換造成的延遲，並搭配「引擎增壓」的創新電壓設計，能自動為運算效能加速、強化效能表現，最後加上關鍵的「工作負載預設集」，能於BIOS中預先設定最佳化的伺服器設定檔，讓整體的效能與效率巨幅躍進，自此將效能表現推升至全新境界，為企業用戶提供最高品質的運算解決方案。
華碩伺服器搭載全新Power Balancer技術與第二代Intel® Xeon® Scalable處理器，省電、效能雙管齊下為伺服器開創嶄新標準

華碩伺服器去年於國際性標準性能評試機構—SPEC(Standard Performance Evaluation Corporation)的標準測試中勇奪246項世界紀錄，深耕伺服器產業並累積長達23年以上的豐碩經驗，為伺服器系統、伺服器主機板、工作站與工作站主機板的領導品牌。為提供用戶愈臻卓越的運算方案，華碩今日發表獨家Power Balancer技術，將應用於「RS720／720Q／700 E9」、「RS520／500 E9」與「ESC8000／4000 G4」系列伺服器，其具備即時監控與自動調節處理器負載技術，搭配第二代Intel® Xeon® Scalable處理器，能提供風馳電擎的運算效能，且最高可為每個節點節省約31瓦特電力，進而為企業用戶大幅降低用電成本與維持最佳效能，打造極臻完美的運算解決方案。在高效能運算、AI人工智慧或邊緣運算等複雜的應用中，如何在效能與耗電量之間取得平衡，已成為伺服器產業的重要課題。隨著第二代Intel® Xeon® Scalable處理器問世，華碩亦推出全新研發的Power Balancer技術，能即時監控且自動調整處理器負載，大幅降低整體耗電與提升效能表現，充分發揮第二代Intel® Xeon® Scalable處理器的威力。經測試，在維持相同效能時，搭載華碩獨家Power Balancer技術的伺服器最高可節省約14%用電，藉由自動調整處理器頻率，在多執行緒的運作方式中有效降低耗電量，為企業省下可觀的用電成本。此外，根據「SPEC CPU® 2017」標準評測顯示，搭載第二代Intel® Xeon® Scalable處理器與Power Balancer技術的伺服器，最高可提升36%的運算效能，同時支援Intel® Optane™持續性記憶體，讓記憶體與儲存能力巨幅躍進，提供用戶前所未見的運算效能表現。華碩伺服器搭載獨家Power Balancer技術、第二代Intel® Xeon® Scalable處理器，以及支援Intel® Optane™持續性記憶體，不僅能大幅降低整體耗電量，更以卓越出眾的極致效能，為企業用戶提供極臻完美的IT解決方案。其中，專為高密度運算而生的「ESC8000／4000 G4」機架型伺服器，能提供極致強大的運算能力，滿足用戶對於AI訓練、虛擬桌面 (VDI)、渲染與科學研究等應用，一切皆能游刃有餘；專為高效能工作負載量身訂製的「RS720／720Q／700 E9」機架型伺服器，具2U／1U設計，能滿足企業用戶的多功負載、頂尖效能等運算需求；具備靈活擴充特色的「RS520／500 E9」機架型伺服器，共有4U／2U／1U設計，不論是效能、資料儲存與管理表現，皆能為企業提供全方位的基礎架構管理解決方案。

«
8
9
10
11
12
13
14
»

最多人點閱